智能论文笔记

Deep versus Wide: An Analysis of Student Architectures for Task-Agnostic Knowledge Distillation of Self-Supervised Speech Models

Takanori Ashihara , Takafumi Moriya , Kohei Matsuura , Tomohiro Tanaka

分类：自然语言处理

2022-07-14

自我监督学习（SSL）被视为一种非常有前途的方法，对于下游任务的几个语音，高性能。由于SSL模型的参数通常是如此之大，以至于训练和推理需要大量的内存和计算成本，因此希望通过应用诸如知识蒸馏（KD）等压缩方法来生成紧凑的SSL模型，而无需显着性能降解。尽管KD方法能够缩小SSL模型结构的深度和/或宽度，但几乎没有研究如何改变深度和宽度对小脚印模型的内部表示。本文提供了一项解决问题的经验研究。我们在改变结构和KD方法的同时研究了Superb的性能，以保持参数恒定的数量；这使我们能够分析通过改变模型体系结构引入的表示的贡献。实验表明，一定深度对于准确地求解面向内容的任务（例如自动语音识别）至关重要，而在几个面向讲话者的任务上（例如，说话者的身份），必须进行一定宽度对于实现高性能。基于这些观察结果，我们确定了与以前的研究相比，具有更好性能的更高压模型。

translated by 谷歌翻译

Counterfactual Learning with General Data-generating Policies

Yusuke Narita , Kyohei Okumura , Akihiro Shimizu , Kohei Yata

分类：机器学习 | 人工智能 | (统计)机器学习

2022-12-04

Off-policy evaluation (OPE) attempts to predict the performance of counterfactual policies using log data from a different policy. We extend its applicability by developing an OPE method for a class of both full support and deficient support logging policies in contextual-bandit settings. This class includes deterministic bandit (such as Upper Confidence Bound) as well as deterministic decision-making based on supervised and unsupervised learning. We prove that our method's prediction converges in probability to the true performance of a counterfactual policy as the sample size increases. We validate our method with experiments on partly and entirely deterministic logging policies. Finally, we apply it to evaluate coupon targeting policies by a major online platform and show how to improve the existing policy.

translated by 谷歌翻译

Boosting as Frank-Wolfe

Ryotaro Mitsuboshi , Kohei Hatano , Eiji Takimoto

分类：机器学习

2022-09-22

一些增强算法（例如LPBOOST，ERLPBOOST和C-ERLPBOOST）的目的是通过$ \ ell_1 $ -norm正则化解决软边距优化问题。 LPBoost在实践中迅速收敛到$ \ epsilon $ approximate解决方案，但众所周知，在最坏的情况下，$ \ omega（m）$迭代会在其中$ m $是样本量。另一方面，保证ErlpBoost和C-erlpBoost在$ O（\ frac {1} {\ epsilon^2} \ ln \ ln \ frac {m} {m} {m} {\ nu} {\ nu} {\ nu}）中保证将收敛到$ \ epsilon $ -Approximate解决方案$迭代。但是，与LPBoost相比，每次迭代的计算非常高。为了解决这个问题，我们提出了一个通用的增强方案，将Frank-Wolfe算法和任何次要算法结合在一起，并在迭代上互相切换。我们表明该方案保留与ERLPBoost和C-ErlpBoost相同的收敛保证。一个人可以合并任何次要算法以改进实践。该方案来自增强算法以进行软边距优化的统一视图。更具体地说，我们表明lpboost，erlpboost和c-erlpboost是Frank-Wolfe算法的实例。在实际数据集的实验中，我们方案的实例之一可利用次级算法的更好更新，并与LPBOOST相当地执行。

translated by 谷歌翻译

Quantum-Classical Hybrid Information Processing via a Single Quantum System

Quoc Hoan Tran , Sanjib Ghosh , Kohei Nakajima

分类：机器学习

2022-09-01

基于量子的通信中的当前技术将量子数据的新集成与经典数据进行混合处理。但是，这些技术的框架仅限于单个经典或量子任务，这限制了它们在近期应用中的灵活性。我们建议在需要经典和量子输入的计算任务中利用量子储存器处理器来利用量子动力学。该模拟处理器包括一个量子点网络，其中量子数据被入射到网络中，并且经典数据通过一个连贯的字段刺激了网络进行编码。我们执行量子断层扫描和经典通道非线性均衡的多任务应用。有趣的是，可以通过对经典数据的反馈控制以闭环方式进行断层扫描。因此，如果经典输入来自动力学系统，则将该系统嵌入封闭环中，即使访问对外部经典输入的访问被中断也可以处理混合处理。最后，我们证明准备量子去极化通道是一种用于量子数据处理的新型量子机学习技术。

translated by 谷歌翻译

HTML版本

Sound and Relatively Complete Belief Hoare Logic for Statistical Hypothesis Testing Programs

Yusuke Kawamoto , Tetsuya Sato , Kohei Suenaga

分类：人工智能

2022-08-15

我们提出了一种新方法，以正式描述统计推断的要求，并检查程序是否适当使用统计方法。具体而言，我们定义了信仰Hoare逻辑（BHL），以形式化和推理通过假设检验获得的统计信念。对于假设检验的Kripke模型，此程序逻辑是合理的，并且相对完成。我们通过示例证明，BHL对于假设检验中的实际问题有用。在我们的框架中，我们阐明了通过假设检验获得统计信念的先前信念的重要性，并讨论了程序逻辑内外统计推断的全部图片。

translated by 谷歌翻译

nLMVS-Net: Deep Non-Lambertian Multi-View Stereo

Kohei Yamashita , Yuto Enyo , Shohei Nobuhara , Ko Nishino

分类：计算机视觉

2022-07-25

我们介绍了一种新型的多视图立体声（MVS）方法，该方法不仅可以同时恢复每个像素深度，而且还可以恢复表面正常状态，以及在已知但自然照明下捕获的无纹理，复杂的非斜面表面的反射。我们的关键想法是将MVS作为端到端的可学习网络，我们称为NLMVS-NET，该网络无缝地集成了放射线线索，以利用表面正常状态作为视图的表面特征，以实现学习成本量的构建和过滤。它首先通过新颖的形状从阴影网络估算出每个视图的像素概率密度。然后，这些每个像素表面正常密度和输入多视图图像将输入到一个新颖的成本量滤波网络中，该网络学会恢复每个像素深度和表面正常。通过与几何重建交替进行交替估计反射率。对新建立的合成和现实世界数据集进行了广泛的定量评估表明，NLMVS-NET可以稳健而准确地恢复自然设置中复杂物体的形状和反射率。

translated by 谷歌翻译

Quantum Noise-Induced Reservoir Computing

Tomoyuki Kubota , Yudai Suzuki , Shumpei Kobayashi , Quoc Hoan Tran , Naoki Yamamoto , Kohei Nakajima

分类：机器学习

2022-07-16

量子计算已经从理论阶段转变为实用阶段，在实施物理量子位时提出了艰巨的挑战，物理量子位受到周围环境的噪音。这些量子噪声在量子设备中无处不在，并在量子计算模型中产生不利影响，从而对其校正和缓解技术进行了广泛的研究。但是，这些量子声总是会提供缺点吗？我们通过提出一个称为量子噪声诱导的储层计算的框架来解决此问题，并表明某些抽象量子噪声模型可以诱导时间输入数据的有用信息处理功能。我们在几个典型的基准中证明了这种能力，并研究了信息处理能力，以阐明框架的处理机制和内存概况。我们通过在许多IBM量子处理器中实现框架，并通过模型分析获得了相似的特征内存配置文件来验证我们的观点。令人惊讶的是，随着量子设备的较高噪声水平和错误率，信息处理能力增加了。我们的研究为将有用的信息从量子计算机的噪音转移到更复杂的信息处理器上开辟了一条新的道路。

translated by 谷歌翻译

Composite FORCE learning of chaotic echo state networks for time-series prediction

Yansong Li , Kai Hu , Kohei Nakajima , Yongping Pan

分类：机器学习 | 神经与进化计算

2022-07-06

回声状态网络（ESN）是一种经常性神经网络，由固定的储层组成，其中神经元随机连接和递归连接，仅通过训练输出连接权重才能获得所需的输出。一阶减少和控制误差（力）学习是一种在线监督培训方法，可以将ESN的混乱活动变成指定的活动模式。本文提出了一种基于递归最小二乘的复合力学习方法，以训练初始活动自发性混乱的ESN，其中采用动态回归器扩展和内存数据开发的复合学习技术来增强参数收敛。提出的方法应用于基准问题，以预测Mackey-Glass系统产生的混沌时间序列，而数值结果表明，与现有方法相比，它显着改善了学习和预测性能。

translated by 谷歌翻译

Goal-Aware RSS for Complex Scenarios via Program Logic

Ichiro Hasuo , Clovis Eberhart , James Haydon , Jérémy Dubut , Rose Bohrer , Tsutomu Kobayashi , Sasinee Pruekprasert , Xiao-Yi Zhang , Erik André Pallas , Akihisa Yamada

分类：机器人

2022-07-06

我们引入了责任感敏感安全性（RSS）的目标延长，这是一种基于规则的自动驾驶系统安全保证（ADS）的方法。制定RSS规则保证目标实现 - 除了原始RSS中的避免碰撞外，还需要进行长时间的操纵序列的复杂计划。为了应对复杂性，我们基于程序逻辑引入了一个构图推理框架，其中可以系统地为较小的子赛车制定RSS规则，并将它们组合起来以获取用于较大场景的RSS规则。作为框架的基础，我们介绍了一个程序逻辑DFHL，可满足连续的动态和安全条件。我们的框架介绍了基于DFHL的工作流程，用于导出目标感知RSS规则；我们也讨论其软件支持。我们在安全体系结构中使用RSS规则进行了实验评估。它的结果表明，目标感知RSS确实有效地实现了避免碰撞和目标实现目标。

translated by 谷歌翻译

Speak Like a Dog: Human to Non-human creature Voice Conversion

Kohei Suzuki , Shoki Sakamoto , Tadahiro Taniguchi , Hirokazu Kameoka

分类：人工智能

2022-06-09

本文提出了一个新的语音转换（VC）任务，从人类语音到类似狗的语音，同时保留语言信息，作为人类到非人类生物语音转换（H2NH-VC）任务的一个例子。尽管大多数VC研究都涉及人类VC，但H2NH-VC旨在将人类的言论转变为非人类生物式的言语。非平行VC允许我们开发H2NH-VC，因为我们无法收集非人类生物说人类语言的并行数据集。在这项研究中，我们建议将狗用作非人类生物目标域的一个例子，并定义“像狗一样说话”任务。为了阐明“像狗一样说话”任务的可能性和特征，我们使用现有的代表性非平行VC方法进行了比较实验，以声学特征（Mel-Cepstral系数和MEL-SPECTROGINS），网络体系结构（五个不同的kernel- kernel--尺寸设置）和训练标准（基于差异自动编码器（VAE）基于对抗性网络）。最后，使用平均意见分数评估了转换后的声音：狗的声音，声音质量和可理解性以及字符错误率（CER）。该实验表明，梅尔光谱图的使用改善了转换后的语音的类似狗，而保留语言信息则具有挑战性。强调了H2NH-VC当前VC方法的挑战和局限性。

translated by 谷歌翻译